热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

精选|ClouderaEnterprise5.11的新功能:Hue数据搜索和标记

我们最新发布的Cloudera5.11版本进一步提升了嵌入式搜索和标记的功能,从而实现更快的数据发现,并提高

点击上方“公众号” 可以订阅哦!

作者:Romain Rigaux

网址:http://blog.cloudera.com/blog/2017/05/new-in-cloudera-enterprise-5-11-hue-data-search-and-tagging/



自助服务商业智能和探索性分析仍然是Cloudera公司客户的主要用例。在过去一年中,我们在智能SQL编辑器Hue方面取得了一些重大进展,针对SQL开发人员提供了更为强大的用户体验,并使这些用例更加高效。

 

我们最新发布的Cloudera 5.11版本进一步提升了嵌入式搜索和标记的功能,从而实现更快的数据发现,并提高了书写SQL的效率。请继续阅读了解更多有关增强功能的信息,并点击demo.gethue.com试用改进后的Hue新版本。

 

嵌入式搜索和标记

您是否曾经努力地想记住与项目相关的表名称?找到这些列或视图是否需要太长的时间?现在,Hue可以让您轻松搜索集群中所有数据库的任何表、视图或列。由于具备了搜索成千上万个表的功能,您可以快速查找与您需求相关的表,从而更快速地发现数据。


此外,您还可以使用名称标记对象以便对其进行分类,并将其分组到不同的项目。这些标签都是可搜索的,并且可以通过更简单、更直观的发现加快探索过程。


通过与Cloudera Navigator的集成,现有的标签和索引对象会自动在Hue中显示,您添加的任何其他标签都将回显在Cloudera Navigator中,并且支持熟悉的Cloudera Navigator搜索语法。


Hadoop教程:从Vimeo的Hue团队在Hue中集成Cloudera Navigator。


如需在Hue中集成Cloudera Navigator,请登录Cloudera Manager,跳转到“Hue”>“配置”,并选中两个Cloudera Navigator属性:“启用Navigator元数据服务器集成”和“启用审核收集”。


请参阅相关文档获取更详细的说明。

启用Cloudera Manager中的功能

 

使用方法

在Hue的SQL编辑器中将出现一个顶部搜索栏,其自动完成能力提供了facet一览表,并预先填写顶部值。按下“Enter”键可列出所有可用的对象,并且可以在示例弹出窗口中进一步打开和探索、辅助或直接进入表浏览器应用程序。

 

细粒度搜索

默认情况下,只返回表和视图。可使用'type:'过滤器搜索列、分区、数据库。

搜索示例:

 

●  table:customer → 查找客户表。

●  table:tax* tags:finance → 列出所有以tax开头并且标记是'finance'的表。

●  owner:admin type:field usage → 列出admin用户创建的与usage匹配的所有字段。

 

安全性

在安全集群中,配置了Sentry,Hue可以确保结果只包含用户可以根据其Sentry权限访问的对象。这也意味着facet搜索被简化。

 自动完成功能列出了当前匹配的表

具有预览和标签版本的搜索结果

 

SQL改进

编辑器不断改善。以下您可以阅读最近主要的改进。

 

自动完成弹出式修改

像常规代码编辑器一样,自动完成分为两部分。这是为了防止在提取当前表或列的元数据时挂起,并显示更多上下文信息,例如注释、对象类型及其全名。

自动完成前

新版本中的自动完成功能

Apache Kudu主键直接表示

 

创建表向导

如果您在文件中创建新的SQL表时遇到困难,您将很乐意了解到,现在可以更容易地完成该操作。随着最新Hue版本的发布,您现在可以以一种特别的方式创建SQL表,从而加快自助服务分析。该向导已经修改成两个简单的步骤,并提供了更多的格式。现在用户只需要完成以下操作:

 

1. 选择一个文件。

2. 选择表的类型。

 

好,就是这样!文件可以从HDFS或S3(如果已配置)拖放、选择,并且可以自动检测格式。当执行诸如表分区、Kudu表和嵌套类型的高级功能时,该向导也可提供帮助。



请点击阅读全文进入微站

(更多技术干货、行业动态,请关注【微站】,不定时更新)



推荐阅读
  • 我们在之前的文章中已经初步介绍了Cloudera。hadoop基础----hadoop实战(零)-----hadoop的平台版本选择从版本选择这篇文章中我们了解到除了hadoop官方版本外很多 ... [详细]
  • Hadoop入门与核心组件详解
    本文详细介绍了Hadoop的基础知识及其核心组件,包括HDFS、MapReduce和YARN。通过本文,读者可以全面了解Hadoop的生态系统及应用场景。 ... [详细]
  • 根据最新发布的《互联网人才趋势报告》,尽管大量IT从业者已转向Python开发,但随着人工智能和大数据领域的迅猛发展,仍存在巨大的人才缺口。本文将详细介绍如何使用Python编写一个简单的爬虫程序,并提供完整的代码示例。 ... [详细]
  • Nginx 反向代理与负载均衡实验
    本实验旨在通过配置 Nginx 实现反向代理和负载均衡,确保从北京本地代理服务器访问上海的 Web 服务器时,能够依次显示红、黄、绿三种颜色页面以验证负载均衡效果。 ... [详细]
  • 无服务器_云原生数据湖架构中的无服务器 Kafka
    篇首语:本文由编程笔记#小编为大家整理,主要介绍了云原生数据湖架构中的无服务器Kafka相关的知识,希望对你有一定的参考价值。 ... [详细]
  • 使用clouderaquickstartvm无配置快速部署Hadoop应用
    http:zzj270919.blog.163.comblogstatic68997776201522561659999目录:通过CDH网站下载cloudera-vm ... [详细]
  • 关于hadoop及相关模块的安装,自己下载模块安装的话较为麻烦,有配置、版本对应的些许问题,使用cloudera集成好的平台也不错 ... [详细]
  • Spark学习之路(一)Spark概述
    一,什么是spark定义:Spark一种基于内存的快速,通用,可扩展的大数据分析引擎.官网地址:http:spark.apache.org历史:2009年诞生于加州伯 ... [详细]
  • 本文详细介绍了Java编程语言中的核心概念和常见面试问题,包括集合类、数据结构、线程处理、Java虚拟机(JVM)、HTTP协议以及Git操作等方面的内容。通过深入分析每个主题,帮助读者更好地理解Java的关键特性和最佳实践。 ... [详细]
  • 在当前众多持久层框架中,MyBatis(前身为iBatis)凭借其轻量级、易用性和对SQL的直接支持,成为许多开发者的首选。本文将详细探讨MyBatis的核心概念、设计理念及其优势。 ... [详细]
  • MySQL缓存机制深度解析
    本文详细探讨了MySQL的缓存机制,包括主从复制、读写分离以及缓存同步策略等内容。通过理解这些概念和技术,读者可以更好地优化数据库性能。 ... [详细]
  • MySQL 数据库迁移指南:从本地到远程及磁盘间迁移
    本文详细介绍了如何在不同场景下进行 MySQL 数据库的迁移,包括从一个硬盘迁移到另一个硬盘、从一台计算机迁移到另一台计算机,以及解决迁移过程中可能遇到的问题。 ... [详细]
  • 使用Pandas高效读取SQL脚本中的数据
    本文详细介绍了如何利用Pandas直接读取和解析SQL脚本,提供了一种高效的数据处理方法。该方法适用于各种数据库导出的SQL脚本,并且能够显著提升数据导入的速度和效率。 ... [详细]
  • 本文探讨了为何相同的HTTP请求在两台不同操作系统(Windows与Ubuntu)的机器上会分别返回200 OK和429 Too Many Requests的状态码。我们将分析代码、环境差异及可能的影响因素。 ... [详细]
  • 原创 | 大数据入门基础系列之ClouderaManager版本的Hive安装部署
    添加服务,一 ... [详细]
author-avatar
爱看好电影110_275
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有